谷歌DeepMind推出4K视频模型，正面迎击Sora

探索 2025-04-19 22:13:54 634

近日，谷歌谷歌Alphabet部门Google DeepMind突然公布Veo 2视频模型，推出距离Veo一代发布仅七个月后，频模现版本已经可以生成最高4K分辨率，型正长达两分钟以上的面迎视频。

要知道，谷歌OpenAI在一周前刚刚正式推出了Sora视频模型，推出同样经过近一年的频模打磨，Sora却依旧受限于1080p的型正最大分辨率。

图片15.jpg

谷歌在关于Veo 2的面迎介绍中提到：“低分辨率视频非常适合移动设备，但创作者希望看到他们的谷歌作品在大屏幕上大放异彩。”显然，推出这段发言直指Sora。频模

谷歌发言人表示，型正Veo 2 的面迎4K剪辑默认限制为8秒，但可以延长至2分钟或更长时间。与之相比，Sora的1080p视频上限仅为20秒。

图片16.jpg

抛开以上这些参数，AI视频模型有个问题绕不过，就是那些“低级”BUG。Sora一经推出，很多自媒体都做了测试，坏消息是，各种奇怪的物理和人体表现依旧存在。比如，生成人物可能有许多条腿，或遇到稍微复杂的运动时，扭曲的身体让人看得背后发毛，似乎这是AI现阶段难以逾越的大山。

但谷歌部门声称，在纠正“幻觉”细节（如额外的手指）和展示“现实世界的物理学以及人类运动和表情”方面取得了重大进展。

图片17.jpg

一些具备相关学术背景的专业人士对AI所犯的物理错误发表了看法，他们认为，只能通过所谓的世界模型来解决，这些模型具有理解和生成3D环境的“空间智能”。凑巧的是，谷歌本月早些时候推出了自己的Genie 2世界模型，难道这就是《黑客帝国》的训练场？

同时，Veo 2也能更好理解“电影语言”，比如“18mm镜头”、“浅景深”等专业用语。但是，也有很多人对日趋“合理”的视频模型产生担忧，图像和视频生成器的输出越合理，它们被用于邪恶目的的风险就越大，防伪技术的迭代势在必行。

图片18.jpg

对于Veo 2来说，DeepMind将不可见的SynthID水印置于Veo 2生成的视频中。这种“水印”的优点是，隐匿的SynthID可能会让视频传播者大意，技术人员更容易发现造假视频的证据。缺点也很明显，普通人很难区分一段视频是否由AI生成。

相比之下，OpenAI的Sora会在其生成视频的右下角嵌入一个可见的水印动画，对于普通人更容易分辨。

图片19.jpg

不过大家对于AI视频模型的担忧一定不会停止，现阶段，各家视频大模型还是以秒或分钟来生成，而且相对比较容易分辨。但按照当今的发展速度，未来AI生成的视频一定会以假乱真，到时候我们将如何面对互联网世界？你所喜爱的视频博主，也许根本不存在。

本文仅代表作者观点，不代表本站立场。
本文系作者授权发表，未经许可，不得转载。

EA211或成增程“王炸”，大众首款增程式SUV上海车展前亮相

小米汽车100问，官方回答来了！定价不会是19.9万

照片被挂孙笑川吧并遭网暴后，我起诉了挂我的人

中国地质调查局原党组书记、局长钟自然被查

古典文学研究学者叶嘉莹逝世，享年100岁

CES2024丨3i黑科技智能清洁产品亮相CES，定义未来清洁新范式

“国字号”金融旗舰中邮证券安徽分公司落子合肥

内置超10000mAh大电池，一次可以盖两桶泡面，vivo这款大平板即将发布